查看原文
其他

锤子M1“助攻”科大讯飞上头条,语音识别蓝海到了?

2016-10-19 秦 妍 TechNews科技新报


继状告百度输入法侵权上了头条后,科大讯飞借锤子科技新品发布会,又上了一次头条。

2016 年 10 月 18 日晚上,锤子科技发布了最新旗舰智能手机 M1 与 M1 Plus 。会上,锤子科技创始人罗永浩向公众展示了新旗舰手机的多项功能,其中科大讯飞超精准的语音输入赢得了诸多观众的掌声。

据罗永浩透露,科大讯飞的语音识别率已经高达 97 %,如果不是发给那些非常咬文嚼字的人看的话,经过讯飞语音识别的文字基本可以直接发送。




▲ 讯飞语音输入获锤子力挺(Source:锤子科技微博)


语音输入比键盘输入更加方便(无需用手)、快速(人每分钟能讲出 150 个单词,却只能打出 40 个字)的优势,这是其兴起的基础。

科大讯飞的语音输入,为我们揭示了语音识别应用的冰山一角。事实上,除了让机器将语音转换成文字,语音识别还能将语音信号转换成命令,从而成为互联网场景下的控制中心。


语音识别蓝海即将到来,三大应用引期待


近年,伴随物联网技术与人工智能技术不断落地,语音识别技术重要性不断凸显。“互联网女皇”玛丽·米克尔发布的 2016 年互联网趋势报告中,将语音识别技术列为重要的技术趋势,玛丽·米克尔认为,未来的计算界面将可由键盘升级至麦克风加键盘的模式。

另外,亚马逊的 Echo 音响内置了 Amazon Alexa 语音助手、苹果在手机以及电脑上搭载了 Siri ,微软推出了小娜与小冰;谷歌正式推出了面向 Android 与 ios 系统的 Allo ……科技大佬们正积极推动语音识别技术的发展。

受以上因素刺激,业界认为,语音识别技术的蓝海即将到来,从业界的动态来看,其在搜索引擎、智能家居以及智能汽车三方面的应用备受期待。

语音识别将可取代传统的搜索引擎,成为互联网的重要入口。 Amazon Alexa 、 Siri 、微软小娜、谷歌 Allo 都在为此目标努力,取代传统搜索引擎后,语音识别技术将可收获网络营销、用户调研、收费问答等多个领域的市场。

智能家居领域,需要将多款遥控设备集成于一个设备中,供用户操作,大多时候,智能手机 APP 充当了这一功能。语音识别技术加入后,通过声音指令,即可实现对家居环境中各个联网设备的控制,这种方式更加便捷。

智能汽车领域中,自动驾驶技术无疑是重点,除此之外,语音识别技术也能有效提高汽车的智能性。比如可进行全语音交互的地图导航、又比如驾驶之外的车内交互场景(打电话、查询天气、播放音乐等)。

延时与准确两大痛点,语音识别技术待提升

语音识别技术前景无疑是美好的,不过,现阶段,语音识别还受困于技术痛点,难以大范围应用,主要体现在延时与准确性两方面。

在语音转换成文字方面,科大讯飞等企业速度已经比较能让人接受了,不过在语音指令方面,Siri、微软小娜等还会有延时的现象,机器理解并采取回应的过程需要更多时间,不过一个指令需要用户等待十秒甚至以上的,则很难被市场接受。

准确性上,有媒体对科大讯飞的语音输入做过实测,结果显示,在语速慢的情况下,科大讯飞语音能很快将语音准确地翻译成文字;不过,在语速快、中英文夹杂的情况下,准确性有所下降。

另外,语音输入的准确性还面临方言以及使用环境的挑战。

因此,未来语音识别技术还需要在速度和准确性上有所提升。尤其是准确性,业界相信,当语音识别技术准确度提高到99%的时候,将会改写当前人机交互的规则。


延伸阅读:


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存